(網(wǎng)經(jīng)社訊)9月25日,2024百度云智大會(huì)在北京中關(guān)村國際創(chuàng)新中心舉行。會(huì)上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖圍繞算力、模型、應(yīng)用三個(gè)話題,與行業(yè)專家、企業(yè)領(lǐng)袖和技術(shù)極客,共同探討如何在新一輪技術(shù)變革中更好搶抓機(jī)遇、實(shí)現(xiàn)智能躍升。
沈抖表示,過去一年是大模型從技術(shù)變革走向產(chǎn)業(yè)變革的關(guān)鍵一年,而大模型和云計(jì)算緊密結(jié)合,正在成為新型的基礎(chǔ)設(shè)施。我們知道,在歷史上這樣大范圍的基礎(chǔ)設(shè)施升級(jí)并不多,但每次升級(jí)都能帶來生產(chǎn)力的巨大躍遷,而且一次比一次速度更快、影響更大。
圍繞大模型算力方面,沈抖表示,提到算力,不少人都聽說過“萬卡集群”,簡(jiǎn)單來說,GPU集群有三個(gè)特征:極致規(guī)模、極致高密和極致互聯(lián)。
而這些“極致”帶來了幾個(gè)嚴(yán)峻的挑戰(zhàn)。沈抖介紹,首先是巨額的建設(shè)、運(yùn)營(yíng)成本,建一個(gè)萬卡集群,單是GPU的采購成本就高達(dá)幾十億元。其次,在這么大規(guī)模的集群上,運(yùn)維的復(fù)雜性急劇增加。他談到,硬件不可避免地會(huì)出故障,而規(guī)模越大,出故障的概率就越高?!癕eta訓(xùn)練Llama3的時(shí)候,用了1.6萬張GPU卡的集群,平均每3小時(shí)就會(huì)出一次故障。”
據(jù)網(wǎng)經(jīng)社云計(jì)算臺(tái)(CC.100EC.CN)獲悉,百度智能云同時(shí)公布了千帆大模型平臺(tái)的最新“成績(jī)單”,在千帆大模型平臺(tái)上,文心大模型日均調(diào)用量超過7億次,累計(jì)幫助用戶精調(diào)了3萬個(gè)大模型,開發(fā)出70多萬個(gè)企業(yè)級(jí)應(yīng)用。過去一年,文心旗艦大模型降價(jià)幅度超過90%。